微软语音技术不断突破,加速各行业发展
丹棱君有话说:计算无处不在,5G 的快速发展将加速世界的互联互通,各行各业对于数字化转型解决方案的需求正逐渐上升。“听”时代已经来临,以有声读物领域为例,德勤预测全球有声读物市场规模将在 2020 年扩大 25%,达到 35 亿美元。语音是沟通重要的纽带,随着智能语音能力的不断成熟,各行业正通过拥抱语音解决方案提高生产力和用户体验。作为微软 AI 能力的一部分,微软智能语音性能已可媲美人类水平,正在通过强大的平台工具赋能各行各业,并在疫情期间助力企业复工复产。
微软人工智能语音组产品总监 丁秉公
几十年来,微软一直从事着与人工智能相关的技术研发,微软全球人工智能首席技术官,原微软首席语音科学家黄学东此前更是在采访中指出,语音和语言技术是AI皇冠上的明珠。在万物互联的 5G 时代下,随着低延时、低功耗、高带宽的到来,语音交互也将会成为一个主流。
“伴随语音技术更加成熟,应用场景越来越丰富,语音交互通过定制也将可以达到更加卓越的效果。这里包括两个层面,就语音识别来说,一个语音识别系统的识别精度会受到领域相关的词汇影响很大。通过定制,就可以针对某一个领域的专业词汇,让它的识别精度在原有通用模型的技术上变得很高,还可以针对每一个人的这个口音进行定制。另外一个方面来说,微软语音合成的定制可以为企业定制从男女,到不同年龄的丰富音色,甚至对于同一个音色我们可以定制各种的风格。” 在谈到不断优化的语音交互体验时丁秉公说道,“因为 5G 时代的网络会比现在更加快更加好,联上网一定会有很好的网络服务,所以基于这两点,我相信整个语音的应用会有一个爆发式增长。”
作为一家全球公司,微软语音也是支持了世界上的主要语种,其中语音识别技术支持 39 个国家与地区的语言、语音合成技术支持 80 个多语言发音以及翻译支持 60 种语言互译。同时,Azure 拥有全球覆盖最广的数据中心,所以微软语音语种的全球覆盖加上 Azure 云的全球覆盖保证了微软和其生态伙伴能够一起赋能世界上的每一个人和每一个组织。
丁秉公认为,中国 AI 语音创新无论是在技术、产品上,还有商业模式上都会有特别大的潜力。语音技术也将因此走进千家万户让普罗大众,特别是包括视障和听障人士,都可以享受到技术带来的益处。并且,未来语音技术也将越来越会像空气一样,融入日常生活。只要对着一个东西,一个设备,一个服务去说话,就能够被理解并得到响应和互动。
微软 CEO 萨提亚·纳德拉曾在微软 Ignite 大会上写了一个公式叫 technologyintensity (技术密集)= (tech adoption 技术落地x tech capability 技术能力)^ Trust(信任)。所谓的技术密集就是随着数字化的不断深入,企业可以利用数字工具和平台结合行业和自身的特点开发专有技术、产品和服务,以迎接不断涌现的新机遇和新突破。为了打造一流的技术密集未来,微软语音研发团队的目标是让语音技术的能力能够实现跨领域、跨语言、跨用户的不断提高同时增加技术落地赋能,让每个企业和个人能通过技术实现繁荣发展;最后是发展可信赖和负责任的技术,这也是其最珍视的技术底线。
丁秉公表示:“希望微软语音技术可以帮助中国的AI生态走得更远更好。帮助更多的中国企业走出去,也可以帮助国外的企业走进中国,享受无缝的语音服务,没有语言的障碍。这次疫情也让我们更加感受到世界各国的联系其实远比许多人所想象得更紧密。在这个地球村,我们需要来共同应对和解决关乎人类共同命运的问题。我们也希望微软的语音技术能够帮到大家。”
本文转自环球网
了解更多:
对话微软研究院负责人Peter Lee博士:AI,云计算与医疗健康的未来 微软以技术全方位支持疫情前线医院 微软语音识别技术屡破世界纪录的秘密都在这里了 对话黄学东:语音语言技术是镶在 AI 皇冠上的明珠 世界人工智能大会丨与人类媲美的语音识别与机器翻译 微软“晓晓”让温暖的声音浸润心目图书馆 | AI for Good 让电脑说人话 | 数字化转型 ING 文档一键朗读,如何能助力全民“抗疫”?| 微软百宝箱
后台入驻微软小冰
如果你很萌,请跟她一决高下!